Dataset EDGAR de Stanford: preentrenamiento eficiente para finanzas
Dataset abierto de presentaciones SEC con 152B tokens, fiel al diseño. Ideal para entrenar LLMs en finanzas. Benchmarks: EDGAR-Forecast y EDGAR-OCR.
Dataset abierto de presentaciones SEC con 152B tokens, fiel al diseño. Ideal para entrenar LLMs en finanzas. Benchmarks: EDGAR-Forecast y EDGAR-OCR.